home *** CD-ROM | disk | FTP | other *** search
/ BCI NET 2 / BCI NET 2.iso / archives / demos / misc / prosite.lha / Prosite / data / PDOC00024 < prev    next >
Encoding:
Text File  |  1995-03-04  |  2.9 KB  |  64 lines

  1. ******************************
  2. * 'Trefoil' domain signature *
  3. ******************************
  4.  
  5. A cysteine-rich  domain of  approximately forty five   amino acid residues has
  6. been  found in some proteins from   different biological   sources [1,2].  The
  7. 'trefoil' domain contains six cysteines that are most probably linked by three
  8. disulfide bonds. The proteins that are known to contain this domain are:
  9.  
  10.  - Pig Pancreatic Spasmolytic Polypeptide (PSP) [3], a protein of 106 residues
  11.    that inhibits  gastrointestinal motility and  gastric  acid secretion.  PSP
  12.    could also be a growth factor.  PSP contains two  copies  of  the 'trefoil'
  13.    domain.
  14.  - Human protein pS2 [4], a protein secreted by the stomach mucosa, whose gene
  15.    is induced by  estrogen.  The exact function of pS2 is not known.  pS2 is a
  16.    protein of 84  residues  (including  a  signal peptide of 21 residues). pS2
  17.    contains one copy of the 'trefoil' domain.
  18.  - Xenopus preprospasmolysin [5], a skin  gland precursor protein of 400 amino
  19.    acid residues. This protein contains 4 copies of the 'trefoil' domain.  Two
  20.    of these domains are in the N-terminal of the protein, while the two others
  21.    are  in  the  C-terminal end;  the  separating  space  consists  of  tandem
  22.    threonine/proline-rich repeats. The function of this protein is not known.
  23.  - Xenopus 'APEG' protein [6], a skin  gland  protein of about 400 amino acids
  24.    that mostly consist of tandem repeats of the sequence G-[E/G]-[A/P](2,4)-A-
  25.    E.  This protein contains,  at  its  C-terminal extremity,  a  copy  of the
  26.    'trefoil' domain.
  27.  
  28. Structurally the 'trefoil' domain can be represented as shown below.
  29.  
  30.               +-------------------------+
  31.               |         +--------------+|
  32.               |         |              ||
  33.             xxCxxxxxxRxxCG#xxxxxxxCxxxxCC#xxxxxxxxWC#xxxxxxxx
  34.                      *************|*****           |
  35.                                   |                |
  36.                                   +----------------+
  37.  
  38. 'C': conserved cysteine involved in a disulfide bond.
  39. '#': large hydrophobic residue.
  40. '*': position of the pattern.
  41.  
  42. -Consensus pattern: R-x(2)-C-G-[FY]-x(3)-[ST]-x(3)-C-x(4)-C
  43. -Sequences known to belong to this class detected by the pattern: ALL.
  44. -Other sequence(s) detected in SWISS-PROT: NONE.
  45.  
  46. -Note: the residue in  position 7 of the pattern is Pro, except  in  the third
  47.  'trefoil' domain of Xenopus preprospasmolysin, where it is replaced by Ile.
  48.  
  49. -Last update: November 1990 / Text revised.
  50.  
  51. [ 1] Thim L.
  52.      FEBS Lett. 250:85-90(1989).
  53. [ 2] Baker M.E.
  54.      Biochem. J. 253:307-308(1988).
  55. [ 3] Thim L., Thomsen J., Christensen M., Jorgensen K.H.
  56.      Biochim. Biophys. Acta 827:410-418(1985).
  57. [ 4] Rio M.C., Bellocq J.P., Daniel J.Y., Tomasetto C., Lathe R.,
  58.      Chenard M.P., Batzenschlager A., Chambon P.
  59.      Science 241:705-708(1988).
  60. [ 5] Hoffmann W.
  61.      J. Biol. Chem. 263:7686-7690(1988).
  62. [ 6] Gmachl M., Berger H., Thalhammer J., Kreil G.
  63.      FEBS Lett. 260:145-148(1990).
  64.